草庐IT

php - PHP 网页抓取

全部标签

ruby - 如何用 Ruby 编写网络抓取工具?

我想抓取一个没有API的热门网站(例如Quora)并获取一些特定信息并将其转储到一个文件中-比如说csv、.txt或.html格式很好:)例如仅返回Quora用户的所有“简历”列表,这些用户在其公开信息中列出了职业“UX设计师”。我如何在Ruby中做到这一点?我对Ruby&Rails的工作原理有一定程度的了解。我刚刚完成了一个Rails应用程序——主要是我自己写的。但无论怎么想,我都不是大师。我了解正则表达式等 最佳答案 你最好的选择是使用Mechanize.它可以跟随链接、提交表格,以及您需要的任何东西,Web客户端。顺便说一句,

jquery - 用于下载和解析网页的语言/库?

什么语言和库适合用脚本来解析和下载少量网络资源?例如,一些网站发布伪播客,但不是正确的RSS提要;他们只是定期发布一个MP3文件和一个包含播放列表的网页。我想编写一个脚本来定期运行并解析链接和播放列表信息的相关页面,下载MP3,并将播放列表放在MP3标签中,以便它在我的iPod中很好地显示。我也可以编写很多类似的应用程序。您会推荐什么语言?我希望脚本在Windows和MacOS上运行。以下是一些备选方案:JavaScript。这样我就可以使用jQuery进行解析。不过我不知道jQuery是否可以在浏览器之外工作。python。可能很好的图书馆支持做我想做的事。但我不喜欢Python语法

如何在PHP中动态获取页面标题

我获得了我的主页标题,但是在获取内部页面(可变帖子)方面,它不起作用。$path=$_SERVER['PHP_SELF'];$page_title=basename($path);switch($page_title){case'index.php':$title="Welcometothethewebsite";$description="descriptiongoeshere";break;case'about.php':$title="Welcometothethewebsite";$description="somehtinfd";break;case'career.php':$tit

ruby-on-rails - 在 Ruby/Rails 中是否有 PHP 的 print_r 的等价物?

在PHP中你可以这样做:print_r($var)或vardump($var)打印有关变量的“人类可读”信息。在Ruby/Rails中是否有等效的函数/助手? 最佳答案 在Rails模板中你可以做它会做很好的HTMLPRE输出。 关于ruby-on-rails-在Ruby/Rails中是否有PHP的print_r的等价物?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/49143

无法通过PHP连接到MSSQL

连接到MSSQL失败。错误信息:SQLSTATE:HYT00Code:0Message:[unixODBC][Microsoft][ODBCDriver13forSQLServer]LogintimeoutexpiredSQLSTATE:08001Code:10057Message:[unixODBC][Microsoft][ODBCDriver13forSQLServer]TCPProvider:Errorcode0x2749SQLSTATE:08001Code:10057Message:[unixODBC][Microsoft][ODBCDriver13forSQLServer]Anetw

ruby-on-rails - 是否有与 PHP 的 isset() 等效的 Rails?

基本上只是检查以确保设置了url参数。我如何在PHP中做到这一点:if(isset($_POST['foo'])&&isset($_POST['bar'])){}这是RoR中isset()的粗略/最佳等价物吗?if(!params['foo'].nil?&&!params['bar'].nil?)end 最佳答案 更接近的匹配可能是#present?#returnstrueifnotnilandnotblankparams['foo'].present?还有一些其他的方法#returnstrueifnilparams['foo'].

javascript - 如何为动态网页创建google amp?

有没有办法为动态网页创建googleamp?我的网站包含潜在客户表单、页面评论等表单元素。我对AMP印象深刻,并希望在我的网站中实现它。 最佳答案 这要看有多“动态”了。AMP可以被认为是HTML的精简版。不允许包含任意脚本,但Google维护了一组approvedAMPextensions可以让您执行添加Accordion、灯箱、广告单元等操作。您也不能包含表单标签或任何HTML表单元素(输入、选择、文本区域等)。但是,您可以使用amp-iframe在您的AMP页面中嵌入另一个网页。此其他网页不必符合AMP规范,因此您可以自由地以

javascript - Ajax 调用网页方法不起作用

我愿意functionCallPageMethod(methodName,onSuccess,onFail){varargs='';varl=arguments.length;if(l>3){for(vari=3;i我的脚本管理器是但是当我执行select函数时,我什么都没有……根本没有消息。错误日志:[ArgumentException]:UnknownwebmethodSelectBook.Parametername:methodNameatSystem.Web.Script.Services.WebServiceData.GetMethodData(StringmethodNam

javascript - 如何将 m4v 视频文件嵌入到我的 html 网页中?

我目前正在尝试将m4v视频嵌入到我的html网页中。使用以下代码它在googlechrome中完美运行。它需要mozilla的ogv视频浏览器。因为我们无法从客户端获取ogv视频。我也在使用它在英雄框架中。我还尝试使用youtube嵌入代码使用的iframe标签。它适用于webkit浏览器(googlechrome)。但无法在mozillafirefox浏览器中播放。我需要在跨浏览器中播放m4v视频。有什么方法或我在这里缺少任何html标签吗?我探索了很多但找不到有效的解决方案。 最佳答案 m4v格式文件不被浏览器支持,这些格式需要

javascript - 你怎么能抓取dom中的元素并在没有id的情况下应用不同的css?

我在这里有点困惑。我正在做一个动态元素,我想应用不同的css具有相同类但没有id的div。我如何将不同的css应用到具有相同类的第一个div,然后不同的css到同一类的第二个div等等......假设我将fullwidthContainer类应用于3divs对于第一个div,我想要宽度1000px,第二个我想要800px等等。我不能在这里给出id或其他类,因为它是动态生成的。请帮忙。谢谢。好的,我是用javascript做的functionemphatic(){vartotalContainers=document.getElementsByClassName('fullwidthCo